更加灵活的助记媒介架构

原文:Architectures for a more flexible mnemonic medium | Patreon 上的 Andy Matuschak

本月的更新我想做些新尝试——分享一些尚未完成,稍显粗糙的设计工作。这样做有一点很矛盾,就是很多设计还没有敲定,向别人展示起来要费不少功夫。为了交代得通顺,就必须多做不少修修补补的工作。如果设计师在设计所或者公司里规模很大的小组里工作,对这套重活已经很习惯了。但我独立工作,这样做很不自然庆幸的是,你们很了解背景信息,所以我希望你们能忍一下,发挥些想象力。虽然本次讨论以概念为主,但也很依赖于实际界面,因此本文没有音频版本。

上个月我介绍了助记媒介的一个关键设计问题:它把作者放在驾驶座上,假设读者想线性、完整地阅读——并记忆!有时候,这种方式确实恰到好处,但在很多情况下,读者可能(合理地)希望能亲自驾驶,有目标、有计划地阅读。

为了实现这个目标,我开始反思这个媒介的原语。我希望避免创造出好几种不同的媒介「模式」,而是想找出一些基本的元素,这些元素在不同的情况下,能够被作者和读者以各种方式重新组合。当你找到正确的抽象方法,就会有一种「顺着宇宙的纹理」进行雕刻的感觉——感觉上更像是在发掘原本就存在的东西,而非从头创造。比如,VisiCalc 的单元格,文件和文件夹,贝塞尔曲线及其相应的画笔工具,Photoshop 的图层,等等,它们都有这种力量。

阅读场景和行为谱系

要找到这样的原语,通常意味着要找出许多种活动所共有的一些模式。因此,我分析了各种阅读情况,试图发现其中的共通性。

我找到了四个特定场景,这些场景对我们来说具有指导意义。当然,这并不意味着涵盖了所有情况,但它们覆盖了一个较大的范围,同时也揭示了这个问题的复杂性:

  1. 阅读一本引导式的入门读物,用来在一个自己感兴趣的新领域找到立足之地。如果你有兴趣的话,《量子国度》是一个很好的例子。

  2. 经典文献中提取精华,辅助项目创作,或者满足兴趣。例如,如果你研究机器学习,你可能会仔细研究 GPT-3 的论文。

  3. 查询参考资料、年鉴或手册,以了解有关某个具体问题的信息。这将包括维基百科和我们的数据世界上的许多文章。但它也可能包括像「伟大的首席执行官」这样的手册,其结构设计上就考虑到了按需阅读。

  4. 启发而阅读。《纽约客》的文章;反思性的博客文章;像《人类简史》或《思考快与慢》(假设这些主题不是你的创作重点)这样面向大众的非虚构读物。这类阅读通常是为了享受阅读的乐趣,所以读得相对轻松。

助记媒介是否应该覆盖所有这些不同的阅读场景?我其实心里没底。例如,对入门读物,它的好处很明显,但对于启发阅读,效果就没那么明显了。说实话,最省力的做法应该是专注于那些读者众多且兴趣相近的「关键」文本。然而,在设计中我悟出的一条原则是,尽管 80/20 原则有其道理,但为比你立即要实现的范围更大的目标进行设计往往颇具价值。后者可以帮你找到更通用的原语,这些元素能让你「逐步成长」。相反,过于追求 80/20 原则往往会构造出一种限制未来扩展的框架。更糟的是,一旦建立了这样的框架,可能会局限你对未来发展的想象力。当然,关键的挑战在于,你得找准问题的边界在哪。当你扩大问题范围时,设计难题将变得越来越棘手,而且跟你将要进行原型测试的实际情况的紧迫性可能会脱节。我是否应该尝试构建一种包含未来基于机器学习的卡片生成互动的设计架构?要不要全面整合个人知识管理系统的其他部分?我现在的答案是「不」,但我会试图考虑大范围的不同阅读场景。这些都是我认为,由专家撰写的间隔重复卡片可能大有裨益的场景。

这些阅读情境中的一个主要变化轴线是完整性。如果你正在阅读一本引导式的入门读物或学习一篇重要的出版物,你可能想记住所有的关键细节。但是,如果你在查阅像维基百科这样的参考资料,你可能会进行非线性的阅读,只关注文本中的部分内容——对应的,记忆系统也应做出相应的调整。同样地,在为启发而阅读时,你通常对完整性的需求就没那么高了:你可能会全文通读,但你大多只关心一些高层次的「要点」。需要注意的是,后两种情况在不完整性的性质上是有所不同的:在查阅参考资料时,读者希望记忆系统支持选择性和非线性,而为启发而阅读时,读者则希望记忆系统支持更高的粒度和较低的细节层次。

另一个重要的变化轴线是读者意图的可读性。入门读物将自己定位为明确的教学资源,因此作者可以默认读者确实想学习这些材料。让文本在某些地方中断,让你试着回忆关键细节,这完全在理。但在大多数其他情况下,嵌入式的复习可能与读者的意图相悖。例如,我们在读者对 David Chapman 的助记文章《地图、领土和元·理性》的反馈中,就能明显感受到这一点。你正在阅读以获得启发,然后——咣当——弹出一个界面元素,要求你记住论证的一些细枝末节。正如一位读者所指出的,这「感觉就像在学校」:这种要求与你的承诺水平格格不入。在许多情况下,嵌入式复习会显得太过教条或自以为是,好像作者在说,读者必须对他们的每个字眼都要深思熟虑。问题在于,有些读者将 Chapman 的文章当作是明确的教学资源来看待。对于这些读者来说,嵌入式复习反而是一大加分项,但作者无法事先知道哪个读者是哪种类型。这就需要媒介能够让读者自主选择,而不给人一种被强加的感觉。

我想介绍的最后一条变化轴线:读者自己写卡片的倾向性。比如你正在阅读一篇和你的创新项目有关的重要论文。你可能想记住作者描述的所有关键细节,但最重要的卡片可能是关于该论文对你自己想法的影响。同样,如果你在读一篇关于人际关系的文章,你可能会发现自己想写一两张卡片,将它与你自己的生活联系起来。但是,在阅读参考文献时,你通常只是获取现有的内容;在阅读入门读物时,你通常对主题的了解不足,无法自己构建太多联系。

因此,我们想确定助记媒介的原语,它们可以被读者和作者以不同的方式使用,以适应这些变化轴线的不同位置。

工作流和基本要求

我们可以从不同位置的典型工作流来考虑这个问题:

  • 当完整性较高时,「在章节/页面中添加所有卡片」是常见的交互......但这些卡片可能会在未来的复习中进行迭代优化

  • 当完整性较低时,媒介应提供方便的途径,让读者主动选择与自身有关的详细信息的卡片...

    • .....可以在阅读时因兴趣而产生的即兴反应,

    • ......也可以在合适的停下来的地方回过头来决定哪些内容重要

  • 当读者有明确的学习意图时,媒介时不时地提示他们回忆所读内容是受欢迎的

  • 当读者的意图不明确时,媒介不应通过强迫他们复习来使他们感到不悦

  • 当读者有可能写他们自己的卡片时,我看到有两个工作流值得关注:

    • 当读者在阅读某段内容中突然发现一个他们想记住的联系,他们应该能立即记录下来

    • 从我的个人经验来看,我觉得在读完一篇文章(或者对于较长的文章,在每个章节的结束处)反思「那又怎样?」然后针对我所观察到的情况写下卡片,是很自然的事情

  • 当读者不太可能建立个人联系时,为编写卡片提供的功能不应妨碍收集作者卡片的工作流

这份工作流清单表明,除了现有的复习场景之外,还有三种重要的卡片展示场景:

  • 在章节分隔或文章结束时,回顾性地批量展示卡片

  • 在阅读过程中针对即时冲动做出反应的内联交互(「哦,让我们确保记住这一点!」)

  • 在复习期间/之后/之间迭代优化,在 Orbit 应用的场景下,而不是在作者网页的环境下

读者可能会在这些场景中自由切换,因此我们不希望设置人为的边界。我们希望有某种基本的原语能够在各种场景中展示卡片——就像一条 Tweet 感觉像一个基本的对象,无论是独立嵌入、显示在列表中,还是部分构造在一个编辑界面中,都同样自在。在这些场景中,详细的功能可能会有所不同,但 Tweet 的形式始终保持一致,让人觉得在不同场景中都是「同一个东西」。

因为部分低完整性的工作流会让读者迅速浏览并从一系列可能的卡片中选取,所以卡片需要以紧凑的形式展示,这点非常关键。这也能帮助机器学习驱动的场景,因为我们可能无法精准地生成你想要的卡片,但如果我们能生产出十张卡片供你挑选,那成功的机会就会大大增加。

Jeffrey Heer 在他 2019 年的论文 Agency plus automation 中,找出了一种设计人工智能交互界面的重要模式:共享的表示方式,这种方式既可以由人创建,也可以由机器创建。这就让机器可以提出可能的行动方案,用户可以流畅地适应/采纳,同时用户的行动可以被机器学习系统以同样的方式理解。谷歌的搜索结果建议(如下所示,摘自 Heer 的论文)就是一个很好的简单例子。如果我们在未来追求基于机器学习的卡片生成,这一原则可能直接适用,但即使在现在,它也很适用于混合作者和读者卡片的问题。**作者的卡片应该与读者的卡片是同「一种东西」。**读者应该能够轻松地改编和修改作者的卡片,就像他们处理谷歌搜索结果建议一样。

img

对于列表展示方式,我总结出的核心需求就是流畅性。当面对一长列由作者或机器学习模型给出的潜在卡片时,读者应能迅速挑选出心仪的那些,然后进行必要的调整。比如,如果在编写卡片时,读者突然发现一条信息实际上可以分成两条,那么此过程不应需要频繁跳转不同的「界面」或「模式」。卡片编辑更像句子,我们通常进行整体修改;在写作或修改卡片时,我应该能随时观察到它的「邻居」的「周边视野」,就像在文本编辑器中编辑段落中的句子一样。

在过去的两年里,我一直在用文本编辑器在纯文本文件中写卡片,这种同时阅读和编辑多张卡片的灵活性让我深深着迷。[1] 我想把这种流畅性带到嵌入式阅读环境中,但比起我那种自由格式的文本文件,我更希望它的结构更为有序。那些待办事项应用给了我很大的启发,它们往往能提供一种连续的文本编辑环境,富于流畅性。苹果的「提醒事项」应用就非常接近我心中的理想状态:

img

这种连续文本编辑的方式有个好处,就是可以灵活地交换格式。你可以选中一堆卡片复制下来——它们不过是带有一些额外标记的 Markdown 文本。因此,你可以把它们粘贴到 Twitter、PDF 注释、源文件的评论部分等地方。同样,你也可以从这些地方复制纯文本卡片,并将其粘贴到 Orbit 中。复杂的卡片「生成器」可以在你选择的编辑器中作为宏来实现。我认为这种可塑性可能会带来一些出人意料的用户行为。

虽然我们常常不能强求读者去参与测试,但在长篇文章中,每个章节间隙都是嵌入交互的理想场所。假设作者做得很到位,章节本就能成为一个相对连贯的材料群。通过将交互元素放在章节末尾,能有效减轻读者在评估和选择相关卡片的压力:在许多情况下,章节会自然地反映出读者的兴趣边界。对本节有浓厚兴趣的读者可能会「添加全部」,然后删除一些不太有趣的卡片;而对本节只是粗略翻阅的读者,可能会忽略相关卡片,或者快速过目然后挑选出一两个。

另外,《量子国度》的读者报告了在章节间隙嵌入交互的一些有趣体验。这些复习环节提供了一种安全感:如果你在阅读时感到不踏实,也不用怕,很快就有一个复习环节来确认你是否理解了应该理解的东西,如果没有,你还会得到一些关于哪里需要更多关注的反馈。嵌入式的复习让他们在阅读的过程中有了明显的「进步」感:复习帮助他们感知到他们在理解主题上的进步。对其他读者来说,嵌入式的复习帮助他们调控自己的阅读节奏:「我读完了这一节,以为我理解了——但回答这些问题时,我发现我完全没有吸收!于是我又回去仔细地读了一遍。」当然,这些效果有其两面性。如果你对待文章的态度就像一个勤奋的学生,那么它们就很有帮助;而如果你是以一种更轻松或策略性的方式阅读,那么它们可能就成了媒介不适当的强加之物。

解决方案草图

我一直在探索可能满足所有这些特性的表示空间。这总是个反复调整的过程,这里展示的方案肯定还处在试验阶段。

img

首先,我们不应该对入门读物场景造成伤害。对于像《量子国度》这样的文本,我们仍然希望「默认」的阅读模式包含插入的复习环节,并「保存」遇到的所有卡片。但是在这些默认的情况下,我们也希望能给读者更多的控制权。如果一个问题显得毫无意义,那你就没必要去学习它。如果你想改写一个问题,你应该能够这样做。如果你想添加自己的卡片,那你也应该有这个权限。

我在这里的做法是:

  • 入门读物和其他明确的教学媒介可以穿插嵌入的复习区,一开始,它们的行为与现在的模式差不多

  • 但在复习过程中,读者可以根据自己的灵感逐步握紧主导权:

    • 如果觉得某张卡片没什么意思,他们可以选择跳过

    • 如果觉得某张卡片的措辞不太好,他们可以进行编辑

    • 如果有灵感,他们可以亲自编写卡片

    • 他们可以直接切换到列表视图,我稍后会介绍一下

  • 读者复习过的卡片(但不包括他们跳过的卡片)会自动添加到他们的账户中;他们跳过的卡片不会

  • 当他们完成复习集时,他们会看到一个鸟瞰式的卡片列表,在那里他们可以:

    • 撤销自动添加复习过的卡片

    • 有选择地添加/删除个别卡片

    • 根据他们的喜好编辑和添加新卡片

实际的结果是:读者不需要进行任何额外的交互就能享受到当前的默认行为,但他们在复习之前、期间和之后都有一系列平滑的机会去修改这种行为。

img

你会注意到,后一张截图展示了一个列表风格的界面。这里的想法是,它是一张连续文本画布,就像前面的苹果提醒界面一样。因此,编写新卡片是一种内联体验(译注:直接在行内操作),而不是一种模态体验(译注:打开一个新的窗口):

img

(查看大图)

同样的列表视图也可以在 Orbit 应用程序中用作「库」视图,以便随着时间的推移不断完善卡片,或者编写新卡片。

我在上面描述的工作流非常适合于入门读物和读者有明确学习意图的情况。在其他大部分情况下,这种做法可能会显得过于强硬,但如果我们简单地反转它——也就是说,使其默认显示列表视图,而不是复习模式,那么这种嵌入式元素在许多情况下应该都能派上用场。这种反转让它的情感色彩有了明显的转变:它不再是一个无情的强制命令,而变成了读者可以利用的工具。如果读者真的有意深入学习,他们可以从列表开始进行复习。

我觉得,将这种嵌入式列表用在博客文章的结尾,或者插在可能吸引各种不同兴趣读者的解释性材料中,都是非常有意义的。但对于许多论文的情境,我还是觉得它略嫌冒昧(毕竟它是一个占据视线的大元素,暗示着:「我的研究结果值得记忆」)。而且,对于特别低完整性的参考场景,如文章 Our World in Data,这样的工作流过于粗糙。

对于后一种情况,我认为内联的上下文交互会很有价值。从高层次来看,你或许只是想在读书时,把觉得重要的点给记下来,相信自己能像变魔术一样把这些内容吸收掉。当然,这个想法除了实现上的难题,理念上也有一些阻碍。我在分析《量子国度》的卡片时,发现约三分之一的卡片并不完全对应于文中的某个具体内容。相反,它们更像是将一大块内容进行综合(例如,「X 门的逆是什么?」)。这种稍微抽象一点的问题,比直接照搬文本的陈述性事实,往往带有更深的概念性——也更有用!因此,在很多情况下,你并不能直接找到一个特定的词句,让它自然地对应到最有用的卡片。

为了处理这类场景,我们或许可以另辟蹊径,而不是死守着精确到具体的文本段落。一个可能的做法是,在文中标记出特定的记号,提示读者「这块区域有相关的学习卡片可以参考」。那些帮助整体理解、综合性的问题,可能就会在介绍某个概念的几段文字之后的记号中出现。

img(view larger image)

注意,这个记号后面弹出的窗口里也展示了同样的卡片列表。

还有一个大胆一些的想法是,我们允许读者选取任何内容,然后我们直接展示出与那一区域相关联的所有卡片——像我前面提到的那样,这种综合性的卡片通常会关联到大片的文本。读者可以自由挑选哪些卡片对他们有帮助。

img

还有一种方法是设置一个常驻侧边栏,再次重述了列表表示,但布局参考了 Google 文档的评论功能,模糊定位。不过,这种常驻显示方式,对于 Orbit 的艺术方向来说可能有些过于强烈了。

img

不管我们追求哪种路径,只要你灵感来临,你都应该可以随时写下你自己的学习卡片,哪怕周围没有作者预设的卡片。

在概念上将嵌入式块与这些更内联的交互整合在一起,存在着许多挑战。在接下来的几周里,我将继续在这些架构上进行迭代,并着手制作交互原型。有新的进展,我会随时告诉你们!

————————

有一篇新的关于课堂上提取练习的系统综述论文(Agarwal et al, 2021)。一时兴起,我直播了关于这篇论文的写作笔记和 SRS 卡片。那些对我写笔记的做法感兴趣的人可能会发现这很有趣。

我要感谢 Ozzie Kirkby 对原型和讨论的贡献,这促成了这篇文章中提出的想法。我还要感谢 Nick Barr、Sara LaHue、Marcos Ojeda、Taylor Rogalski 和 Gary Wolf 提供的有益反馈和讨论。最后,感谢你们所有人的持续支持,使这项工作成为可能。

————————

[1] 我应该注意到,RemNote 在商业上一直在追求类似的想法。我没有在自己的工作中使用过这个产品,但他们最近的重新设计给我留下了深刻印象,他们精简了很多以前感觉很碍事的形式。我的主要兴趣仍然是传媒背景下的卡片,所以我很高兴看到这些人在个人笔记背景下的卡片写作环境方面取得了进展。